其他
开源机器学习软件对AI的发展意味着什么?
翻译|徐佳渝、杨婷
1 机器学习开源软件举足轻重,但未获重视
MLOSS举足轻重
MLOSS未获重视
MLOSS及AI生产函数
2 沃德利地图为AI生产函数提供了最佳替代方案
3 MLOSS通过构建标准、推行实验及创建社区来促进人工智能研究的发展
构建标准
推行实验
创建社区
4 经济激励措施、社会技术因素和意识形态共同决定MLOSS的发展
激励措施
社会技术因素
意识形态
5 MLOSS(深度学习)中的自我强化反馈循环
AI深度学习范式的替代方案
更好地支持深度学习工具有助于加强深度学习
6 MLOSS的未来
趋势1:MLOSS的重心将从深度学习框架转移
趋势2:更多大型预训练模型工具
趋势3:(潜在闭源)数据工具更加多样
对风险的简要反思
因为AI系统通常是可组合的,所以我们预测模型增殖(model proliferation)的风险可能呈非线性增长。由于不良分子可以将不同模式的模型相结合,因此公开可用模型可能产生的风险将远远超出公开的模型数量。如果要严肃对待这种情况,那么我们就必须要在模型发布之前制定谨慎的相关规范。
截至2027年1月,根据Paperswithcode(中国境外),PyTorch和JAX将成为最受欢迎的三大深度学习框架中的其中两大框架。
Python将成为2027年最流行的机器学习语言。
ONNX将成为主流的中间表示框架。
在2023至2027年间,对公众闭源的前5大语言模型不会开源。
截至2027年,三个最受欢迎的数据工具提供平台在很大程度上会是专有的,也就是说他们不会开源堆栈的关键组成部分。
下一步研究方向
其他领域(比如LLVM等编译器)里的MLOSS和OSS有哪些相同/不同点?
我们期望数据工具以何种有别于框架工具的方式发展?
扩展概率编程与深度学习(特别是计算)所需的能力有何不同?
中国的MLOSS与美国的有何不同?这对人工智能研究知识的传播来说意味着什么?
开源数据工具的激励与其他MLOSS(尤其是框架)的激励有何不同?
OneFlow v0.9.0正式发布 OpenAI掌门人Sam Altman的成功学 李白:你的模型权重很不错,可惜被我没收了 比快更快,开源Stable Diffusion刷新作图速度 OneEmbedding:单卡训练TB级推荐模型不是梦 GLM训练加速:性能最高提升3倍,显存节省1/3 “一键”模型迁移,多语言AltDiffusion推理性能翻倍